IF36-P24-TheWorld-TaylorsVersion
This is a school project for a Data Visualization course at UTT,
France. It aims to create meaningful visualizations for a dataset of our
choice ; here, we chose several datasets consisting of Spotify and
Youtube data about popular songs.
Ce repo héberge un
projet scolaire pour un cours de Visualisation de données à l’UTT. Il
vise à créer des visulisations pertinentes pour un dataset de notre
choix ; ici, nous avons choisi plusieurs datasets regroupant des données
de Spotify et Youtube sur des musiques populaires.
Content
L’équipe de projet The World (Taylor's Version) est
composée de quatres personnes : Marielle CHARON, Kevin HERNANDEZ,
Anouchka NEVEU et Amadou ISSAKA AMADOU. Le but de ce projet est de
répondre à plusieurs questions sur le thème de la musique et plus
précisement sur les platformes Spotify et Youtube grace à la
visualisation de données. Le projet sera développé sous R.
git clone https://github.com/IF36-visualisation/projet-if36-p24-the-world-taylor-s-version.git
Vous pouvez également analyser les résultats seuls en ouvrant les
fichiers .html qui rassemblent les visualisations.
Le dataset utilisé (Datasetfinal.csv) est un merge de
deux datasets : Spotify
and Youtube et Spotify
songs. Le merge final pèse 6.55 MB et est sous format CSV. Il
contient 3668 éléments. La clé qui a servi au merge est l’ID de la
musique sur Spotify.
Les deux jeux de données contiennent des données datant de 2023 collectées depuis les API officielles de YouTube et Spotify. On a, notamment, les 10 musiques les plus populaires d’une variété d’artistes.
Le dataset complet possède 50 features, avant cleaning de celles pertinentes. Après cleaning, on a 33 features.
On regroupe les features sous ces catégories :
| Catégorie | Features associées |
|---|---|
| Informations générales | artist, track_name, album, album_type, duration_ms, channel, description, track_album_release_date, … |
| Scores musicaux | danceability, energy, key, loudness, acousticness, instrumentalness, liveness, valence, tempo |
| Popularité | views, likes, comments, stream, track_popularity |
| Variables supplémentaires | uri (Spotify ID), url_spotify, url_youtube, licensed, … |
Les variables supplémentaires n’expliquent pas la donnée pour l’analyse, mais sont utilisées pour structurer le dataset.
Les features se répartissent selon plusieurs types : nominales (nom de l’artiste/musique/album, …), discrètes (tonalité) ou continues (scores musicaux).
Dans ce projet, nous souhaitons répondre à plusieurs questions et suppositions. D’autres points pourraient encore emerger durant la manipulation des données afin de répondre à ces questions.
|
Marielle CHARON 💻 |
Anouchka Neveu 💻 |
Kevin HERNANDEZ 💻 |
Amadou ISSAKA AMADOU 💻 |
<b>
<a href="https://www.npmjs.com/package/get-good-readme">File generated with get-good-readme module</a>
</b>